查看原文
其他

进化树专题(六)| 串联法和并联法构建进化树

曾哥 凌恩生物 2023-06-15

串联法和并联法构建进化树

串联法(Concatenation):先将不同物种之间的每个单拷贝基因单独进行多序列比对,然后将这些比对后的单拷贝基因进行首尾相连串接成一个supergene矩阵,最后将这个supergene用于构建系统发育树。

并联法(Coalescence):先将不同物种之间的每个单拷贝基因单独进行多序列比对,并构建每一个单拷贝基因对应的基因树,然后将所有单拷贝基因对应的基因树进行合并重构出相应的物种树,再进行ML系统发育树的构建。

目前主流的进化树构建基本都是基于串联法,并联法构建进化树的方法很少见。针对这种情况;Mirarab S开发了并联法构建进化树的软件:ASTRAL;该软件2014年发表。目前引用:457。

  • 下载:

https://github.com/smirarab/ASTRAL
  • 安装:

下载压缩包解压后可直接使用

unzip -x Astral.5.6.3

java -jar astral.5.6.3.jar


  • 输入:

Usage: java -jar astral.5.6.3.jar [--help] (-i|--input) <input file> [(-o|--output) <output file>] [(-q|--score-tree) <score species trees>] [(-t|--branch-annotate) <branch annotation level>] [(-b|--bootstraps) <bootstraps>] [(-r|--reps) <replicates>] [(-s|--seed) <seed>] [-g|--gene-resampling] [--gene-only] [(-k|--keep) <keep>] [(-c|--lambda) <lambda>] [(-a|--namemapfile) <mapping file>] [(-m|--minleaves) <minleaves>] [--samplingrounds <samplingrounds>] [(-w|--generepeat) <gene repetition>] [--polylimit <polylimit>] [--dup] [-x|--exact] [(-p|--extraLevel) <extraLevel>] [(-e|--extra) <extra trees>] [(-f|--extra-species) <extra species trees>] [--remove-bipartitions <remove extra tree bipartitions>] [(-d|--trimming) <trimming threshold>] [(-l|--duploss) <duploss weight>]

[--help]                     输出帮助文档

  (-i|--input) <input file>      输入进化文件

  [(-o|--output) <output file>] 输出物种进化结果

  [(-q|--score-tree) <score species trees>] 对所提供的物种树进行评分并退出

  [(-b|--bootstraps) <bootstraps>] 每个基因bootstrap构建的进化树文件;一个基因一行

  [(-r|--reps) <replicates>]     自举次数; 默认100

  [(-s|--seed) <seed>] 设置多基因座自举中使用的种子编号。 (默认:692)

  [-g|--gene-resampling]      除了自举树重新采样之外,还执行基因树重新采样;针对-b参数有效

  [--gene-only]执行自举时只进行基因树重新采样。 不能和-b选项一起使用

  [(-m|--minleaves) <minleaves>]      去除分支数量少于指定数量的基因

  [(-w|--generepeat) <gene repetition>]每个基因座采样的进化树数量。 (默认:1)

  [(-e|--extra) <extra trees>]提供额外的树(带基因标签)用于丰富组群集搜索

  [(-f|--extra-species) <extra species trees>]提供额外的树木(用物种标签)来丰富组群集搜索


input:

每个基因的进化关系;一个基因一行bootstraps:

每个基因的自举的进化关系;一个基因一个文件/path/RAxML_bootstrap.gene1 文件格式

gene1的自举后的进化关系


  • 输出

output:(((((samp1,6),(((('samp2',(73,'samp3')),((((samp4,samp5),(((samp6,samp7),(((samp8,samp9),...,samp9));物种的进化关系文件
  • 程序使用:

java -jar astral.5.6.3.jar -i number.gene.tre -r 1000 -b number.gene.bootstrap.tre.lst -o astral.tre


最终结果:


凌恩生物成立于2014年,专注组学技术在科研领域的应用与研究。公司成立以来,技术团队参与的项目成果成功发表在《Nature》《Cell》《PNAS》等国际顶端学术期刊。

秉承“以客户需求为本,为客户创造价值”的服务宗旨;以高品质、高效率的技术服务,用心打造凌恩品牌,助力您的成功。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存